【レポート】Spatial How-To: In Real Life – Alteryx Inspire 2023
こんにちは、スズです。
現地時間の2023年5月22日(月)~5月25日(木)に、ラスベガスにてAlteryx Inspire 2023が開催されました。本記事では、Alteryx Inspire 2023で開催されたセッション『Spatial How-To: In Real Life』についてお届けします。
セッション概要(日本語訳)
Alteryx YouTubeの人気シリーズをベースに、Alteryxでの空間分析をガイドするセッションです。空間分析の始め方について興味がある方に向けたセッションです。
登壇者
- David Bryson
- Sr. Technical Marketing Manager, Alteryx
- Samantha Hughes
- Sales Engineer, Alteryx
セッションレポート
Building Geospatial Insights - YouTube Playlist
- 数ヶ月前、地理空間インサイトを構築するというYouTubeの動画シリーズを作成した
- Alteryxで5年間、製品マーケティングに携わってきた中で、多くの人々が空間分析について「使い方が難しい」と話しているのを耳にしてきた
- このセッションはYouTubeで公開した動画とデモに基づいている
Types of Spatial Data
- 空間データは大きく分けて3つのタイプがある
- Points
- 地球上の場所、興味のある場所、顧客の場所などを表現したもの
- Lines
- 道路、河川などの線
- Polygons (Areas)
- エリアを定義するための空間的な方法
- 州や郵便番号のようなもの
- 空間データを扱うには、主に3つのフォーマットがある
- シェープファイル
- CSVや空間ファイルのようなもの
- .shpという拡張子で表現される
- KMLファイル
- Google Earthのフォーマットとして知られている
- Alteryx yxdbファイル
Open Data
- 空間データは何処で見つけることができるのか?
- ここ10年ほどの間に、多くの公的機関がオープンデータのポータルサイトに投資するようになった
- オープンデータポータルでは、シェープファイルやKMLファイルを無料でダウンロードできる
- オープンデータを使ってビジュアライゼーションやモデル構築を始めることができる
DEMO
- 「Open Data」をGoogleで検索することで見つけることができる
- 世界中の多くの主要都市でオープンデータで用意されている
- DMG、KML、CSVなどのファイル形式があり、選んでダウンロードする
- ダウンロードしたシェープファイルにAlteryx Designerで接続する
- 空間データは閲覧ツールを使って地図上で参照できる
- このスプレッドシートは多くの人にとって見慣れたもの
- これは空間データで、なぜ空間データであるかというと、4つの列があるため
- 住所、都市、州、郵便番号
- このデータをジオコーディングと呼ばれる処理で空間データにする
- AlteryxのLocation Insightsパッケージでは、このデータの住所、都市、州、郵便番号を取得するツールがある
- 住所などのデータが常に整形された状態とは限らない
- アドレスパースツールを使うことで住所を解析して列を分割できる
- また、州や郵便番号を特定できる
- その他にも正規表現ツールを使ってパースすることもできる
- 緯度と経度を空間オブジェクトに変換するポイント作成ツールがある
- GPSデータは、通常、トラックなどにセンサーを取り付けた場合、センサーから取得する
- GPSを使ってブレッドクラムと呼ばれるものを作る
- Alteryxは緯度、経度、タイムスタンプ、アセットIDなどのデータを取得し、それらすべてをポイントにすることができる
Who are my customers and where can I find more like them?
- Location Insightsパッケージには、人口統計分析というツールがある
- 人口統計分析では、何百もの変数をデータに追加できる
- 追加された変数名は直観的ではない場合は動的リネームツールで人が読みやすい名前に変更する
Trade Area Example
- 商圏とは、ある特定のビジネスが顧客を集める地理的なエリアのこと
- 商圏が重なるとカニバリゼーションが発生してしまう
- 任意の商圏エリアを定義するだけであれば、商圏分析ツールで簡単に設定できる
- 半径や所要時間など任意に設定できる
- 顧客がどこにいて、どの店舗に行ったか分かっていて、店舗と店舗の所在地が分かれば、データセットを結合できる
- 距離ツールを使って、顧客の場所から来店した店舗までの時間や距離を計算できる
Spatial Analytics in Snowflake
Need for Speed
- データはどんどん大きくなり、ワークフローの実行時間は長くなっている
- この状況でスピードが求められている
UPSERT using Output Tool
- データを統合し、時間ごとにデータベースにパケットを出力する方法の場合、最初のパケットの後、応答があるまで次のパケットに進まない
Let's Understand a MERGE Process in Alteryx
- 今回ご紹介したいのはSnowflakeのMERGE
- MERGEを行うためにデータベースに移動するのでは意味がない
Writing a MERGE Statement
- データの書き込み方は4つのセクションに分けられる
- テーブルと主キーを書き込む
- 主キーが一致した場合のアクション
- 主キーが一致しなかった場合のアクション
新しい行を挿入し、最後にある行を呼び出す - 一時テーブルの削除
Summary
- データをバルクロードすることでスピードアップにつながる
- 詳細はAlteryx Communityで公開しているブログをご確認ください
最後に
Alteryx Inspire 2023のセッション『Spatial How-To: In Real Life』のレポートをお届けしました。